نوروزی» یعقوب؛ هماوندی هدی (۱۳۹۴). بررسی مشکلات جستجو و بازیابی تصاویر در موتورهای کاوش 


پر گزیله مشتی یرود گی‌های نکارطین زبان فارسی. پژوهشنامه کتابداری و اطلاع‌رسانی؛ ۵ (۰)۲ ۲۰۶-۲۲۲. 


بررسی مشکلات جستجو و بازبایی تصاویر در موتورهای کاوش بر گزیده 
مبتنی بر وی ژگی‌های نکارشی زبان فارسی 


دکتر بعقوب نوروزی"» هدی هماوندی" 


تاریخ دریافت: ٩۲/۱۰/۱۷‏ تاریخ پذیرش: ٩۳/۵/۱‏ 


هدف: پژومهش حاضر با هدف تعیین مشکلات جستجو و بازیابی تصاویر در موتورهای کاوش ب رگزیده مبتنی بر ویژگی‌های 
نگارشی زبان فارسی انجام شد. 

روش: این پژوه ش از نوع کاربردی است و برای پاس خحگویی به سوالات پژوهش از روش ارزیابی با مشاهده مستقیم استفاده شد. 
جامعه آماری پژوهش شامل سه موتو رکاو شگ وگل ياهو و بینگ است. برا یگر دآوری داده‌هاء از سیاهه محقق ساخته استفاده 
شد و تجزیه و تحلیل داده‌ها در دو سط حآمار توصیفی و استنباطی صور تگرفت. 

یافته‌ها: نتایج پژوهش نشان داد که موتورها یکاو شگ وگل» بینگ و یاهو بسیار ی از ویژگی‌های نوشتاری و معنایی زبان فارسی 
را در هنگام جستجو و بازیابی تصاویر نادیده م یگيرند. همچنین مشکلات مربوط به نگارش وا ژگان مشتقء مشتق- م رکب انواع 
جمع‌های فارسی و مکسر عربی» همزه بدو ن کرسی و استفاده از زبان محاوره در بخش نوشتاری؛ و چند معنایی در بخش معنایی 
از مشکلات عمده زبان فارسی در جستجو و بازیابی تصاویر از اين موتورها ی کاوش به‌شمار م ی یند. به‌علاوه» در بخش معنایی 
و نوشتاری, قابلیت‌ها یگ وگل در انطق با زبان فارسی نسبت به همتایانش بیشتر است. 


کلیددواژه‌ها: با زیابی اطلاعات با زیابی تصویر» موتور جستجو» شیوه نگارش, زبان فارسی 


۱ دانشیار گروه علم اطلاعات و دانش‌شناسی دانشگاه قم رمه. ]تمصع ۵ ۱۳۵۲۵۱۷2۶ 


۲. دانشجوی د کتری علم اطلاعات و دانش شناسی» (م.انصع ۵ (4م۲.102۷۵ 


سال ۵ شماره ۲ پاییز و زمستان ۱۳۹۴ بررسی مشکلات جستجو و بازیابی تصاویر... ۲۰۷ 


مقدمه 

تلاش همیشگی انسان‌ها برای ثبت و ضبط و گردآوری و اشاعه اطلاعات و دانسته‌های خود. موجب 
شد شاهد افزایش قابل‌ملاحظه انتشار و تولید روزافزون اطلاعات در تمامی زمینه‌ها به شکل چاپی و 
الکترونیکی باشیم (داورپنام» ۱۳۸۷). راه‌هایی نیز برای نشر این حجم انبوه اطلاعات به‌وجود آمده است که 
از جمله پر کاربردترین آنها شبکه گسترده جهانی وب است. از ابزارهایی که به منظور سازماندهی و تجمیع 
اطلاعات در فضای وب کاربرد زیادی دارند» موتورهای جستجو" هستند که تبدیل به یکی از سریع‌ترین و 
ساده‌ترین راه‌ها برای کاوش و یافتن اطلاعات در حوزه‌های مختلف و در قالب‌های گوناگون نظیر متن» 
صداء تصویر و چندرسانه‌ای شده‌اند. در همین راستا تصاویر از اهمیت ویژه‌ای برخوردارند؛ چراکه در 
مواردی یک تصویر می‌تواند از صدها کلمه گویاتر باشد. لی‌یو و همکاران" (۲۰۰۷) معتقدند که همزمان با 
توسعه وب و دسترسی به انواع فناوری‌های عکس‌برداری مثل دوربین‌های دیجیتال و پویشگرهای " مخصوص 
تصاویر اندازه مجموعه‌های تصاویر دیجیتال هم به‌سرعت رو به افزایش است. به همین دلیل نیاز به ابزارهایی 
کا رآمد برای جستجو مرور و بازیابی تصاویر با دامنه و موضوعات گوناگون افزایش یافته است. برای نیل 
به اهداف یاد شده سامانه‌های بازیابی تصاویر زیادی ایجاد شده‌اند که یکی از مهم‌ترین آنها موتورهای کاوش 
هستند؛ اما استفاده از این موتورهای کاوش با مسائل و مشکلاتی نیز روبرو است. نوتس (1۹۹۷؛ نقل در 
نبازی» ۱۳۸۲) معتقد است. ردیابی سریع اطلاعات موردنیاز در اینترنت به‌صورت نیازی پیچیده در آمده است. 
از دلایل عمده این پیچیدگی می‌تواند گوناگونی کاربران زبان‌ها و فرهنگ‌های آنان باشد. باوجود اینکه 
موتورهای جستجوی متعددی برای تسهیل جستجو در محیط وب وجود دارند به نظر می‌رسد که توجه آنها 
به زبان‌های غیرانگلیسی در مقایسه با انگلیسی کافی نیست (2007 ,۸۵ ,015ه122). آمارهای مربوط به سال 
۵ در مورد استفاده از اینترنت براساس زبان حاکی از آن است که حدود ۶۲/۴ درصد کاربران انگلیسی 
زبان و ۳۷/۶ درصد غیرانگلیسی زبان هستند (وب‌سایت آمارهای جهانی اینترنت ۲۰۱۵). کاربران فارسی‌زبان 
از جمله ایران نیز در زمره این گروه هستند. چراکه براساس آخرین آمار اعلام شده در سال ۱۳۹۲ از سوی 


مرکز مدیریت توسعه ملی اینترنت بالغ بر ۶۱/۰۶ درصد جمعیت کشور به اینترنت متصل می‌شوند" که توجه 
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۸ پژوهش‌نامه کتابداری و اطلاع‌رسانی؛ دانشگاه فردوسی مشهد سال ۵ شماره ۰۲ پاییز و زمستان ۱۳۹۴ 


به رفع نیازهای اطلاعاتی اين گروه و تشخیص مشکلات زبانی و خطی آنها در استفاده از موتورهای کاوش 
امری اجتناب‌ناپذیر به نظر می‌رسد. 

با توجه به موارد یاد شده. اهمیت استخراج اطلاعات از محیط وب و به خصوص موتورهای کاوش 
مشخص می‌شود و در اين فرایند. زبان جستجو از مهم‌ترین و کلیدی‌ترین موارد است که حساسیت آن در 
رابطه با کاوش و بازیابی تصاویر دوچندان می‌شود چراکه «یکی از تفاوت‌های اساسی میان اطلاعات متنی و 
دیداری ماهیت فرایند بازیابی آنها است. بازیابی اطلاعات متنی» مبتنی بر کشف شباهت‌های معنایی و نحوی 
بین موجودیت‌های متنی است. در حالی که بازیابی اطلاعات دیداری» مبتنی بر کشف شباهت‌های ادراکی و 
تداعی ذهنی است» (2001 ,بل 66 > 220027). موتورهای جستجوی تصاویر تصاویر را از طریق 
کلیدواژه‌ها؛ عنوان» برچسب‌ها» برچسب جایگزین » مشخصه‌های رنگ. بافت. حالت و شکل تصویر که 
به‌طور خود کار قابل استخراج از تصاویر هستند. بازیابی می کنند (2007 ,1676101 ک 137070 نقل در نوروزی 
و ولایتی» ۱۳۸۹). حال آنکه بازیابی واژه‌ها در متون براساس بافت و زمینه کاربرد واژه در متن و جمله انجام 
می‌شود. اما در مورد تصاویر اگر عنوان متنی موجود نباشد اختصاص برچسب جهت شناسایی و نمایه‌سازی 
تصویر به‌وسیله موتورهای کاوش اجتناب‌ناپذیر است که این امر یعنی نحوه و شیوه نگارش برچسب 
اختصاصی نیز بر حساسیت و تفاوت‌های جستجو و بازیابی تصاویر می‌افزاید. به‌عنوان نمونه اختصاص 
برچسب «شیر» به تصویری از یک شیر آب در مرحله کاوش و بازیابی برای کاربرانی که در جستجوی 
تصاویری از شیر به‌عنوان ماده لبنی یا شیر به معنی حیوان هستند مسئله‌ساز خواهد بود. «بنابراین موتورهای 
کاوش تصاویر برای نمایه‌سازی به متن متکی هستند بدین معنی که کیفیت نتایج بازیابی شده آنها به کیفیت 
اطلاعات متنی اطراف یک تصویر و یا همراه با آن (مانند نام فایل» متن مجاور تصویر عنوان صفحه و یا 
برچسب اچ تی ام آل) وابسته است» (2008 ,"[1۸5). هر زبانی از جمله فارسی؛ دارای ویژگی‌ها و ظرایفی 
است که عدم توجه به آنها می تواند موجب ایجاد مشکلاتی در کاوش و بازیابی اطلاعات شود. از همین رو 


پژوهش حاضر تلاش دارد تا مشکلات جستجو و بازیابی تصاویر را به زبان فارسی از موتورهای کاوش 


۱ در صفحه‌های وب هنگام ایجاد پیوند به یک تصویر در قسمت («برچسب جایگزین» عنوان تصویر وارد می‌شود تا هنگام 
نمایه‌سازی تصویر توسط موتورهای جستجو از اطلاعات برچسب جایگزین به‌عنوان کلیدواژه‌های مرتبط با آن تصویر استفاده 
شود و در صورت عدم‌با رگذاری یکث تصویر متن برچسب جایگزین توسط جستج وگران قابل‌رژیت باشد (نوروزی و ولایتی» 
۳۸۹ 
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سال ۵ شماره ۲ پاییز و زمستان ۱۳۹۴ بررسی مشکلات جستجو و بازیابی تصاویر... ۲۰۹ 


ب رگزیده عمومی خارجی گ وگل بینگ و یاهو که براساس رتبه‌بندی‌ها» جزء پراستفاده‌ترین موتورهای 
جستجو با قابلیت پشتیبانی زبان فارسی و هم چنین قابلیت جستجو و بازیایی تصاویر هستند» بررسی نموده و 
ضمن شناسایی عمده‌ترین اين مشکلات (معنایی و نوشتاری. عملکرد آنها را در بازیابی تصاویر به زبان 
فارسی و براساس ویژگی‌های نوشتاری و معنایی" این زبان با یکدیگر مقایسه نماید و کارآمدترین موتور 
کاوش جهت انطباق با زبان فارسی در بازیایی تصاویر را تعیین نماید تا به این ترتیب علاوه بر آزمودن 
مصادیق این قبیل مسائل؛ راه‌حل‌هایی را نیز جهت پیشگیری و رفع آنها مبتنی بر نتایج پژوهش ارائه کند. 


وی ژگی‌های نکارشی زبان فارسی 

در رابطه با ویژگی‌های نگارشی زبان فارسی مرتضائی (۱۳۸۰) دسته‌بندی‌هایی را ارائه کرده است 
که شماری از آنها به انضمام سایر شاخصه‌های قابل تأمل از دید گاه صاحب‌نظران حوزه زبان و ادبیات فارسی 
دراه اه ات : 

الف - وی ژگی‌های نوشتاری: این ویژگی‌ها به‌طور خلاصه شامل: گوناگونی در بررگردان و ضبط 
واژگان بیگانه» عدم یکپارچگی در کاربرد کلمات دخیل از زبان‌های دیگر و معادل پيشنهاد شده از سوی 
فرهنگستان زبان و ادب فارسی» پیوسته‌نوبسی و جدانویسی واژگان مشتق و م رکب و علائم جمعء تعدد علائم 
جمع (هاء ان» ات ین؛ ون) و وجود جمع بی‌قاعده عربی در زبان فارسی استفاده از تای منقوط نحوه نگارش 
همزه میانی و پایانی کلمات با کرسی واو دندانه. الف و بدون کرسی» صورت‌های مختلف نگارش الف 
مقصوره و مستوره در واژه‌ها» استفاده یا عدم استفاده از اعراب گذاری. و سایر علائم در مورد واژه‌هایی با 
شکل نوشتاری یکسان و تلفظ متفاوت. کاربرد یا حذف علائم همزه تشدید» تنوین» مد و بعضی علائم مانند 
«ی» میانجی و ...هستند که سبب ایجاد مشکلاتی در فرایند جستجو و بازیابی اطلاعات شده‌اند. همچنین 
واژه‌های دو املایی (واژه‌هایی با واج یا آوای مشت رک و شکل نوشتاری متفاوت)؛ استفاده از زبان محاوره و 
شکل عامیانه واژه‌ها در نوشتار» کسره اضافه و بدل‌های آن» جابه‌جایی ی و همزه در کلمات فارسی نحوه 
نگارش ۰۱ غیرملفوظ و «ی» میانجی. وجود نقطه‌ها و دندانه‌های متعدد در بالا و پایین حروف نیز در این 
زمره‌اند (گل‌تاجی و بذ رگ ۱۳۸۹) مسائل یاد شده باعث می‌شود که کاربر در کاوش و بازیابی اطلاعات از 


۷۷۷۷۷ ,۱۷۷۷۱۷۰۵112.001 ب216:001 ۷۷۷۷۷۷۰۵00 ۰ 1 
۲ در بعضی متون از بحث نوشتاری با عنوان نحوی نیز یاد می‌شود. اما در پژوهش حاضر براساس نظرات اساتید زبان و ادبیات 
فارسی» واژه نوشتاری استفاده شد که دربر گیرنده سایر مباحث نیز باشد. 


تمصع یک زومامطاننم۷ .3 


۰ پژوهش‌نامه کتابداری و اطلاع‌رسانی» دانشگاه فردوسی مشهد سال ۵ شماره ۰۲ پاییز و زمستان ۱۳۹۴ 


موتورهای کاوش دچار سردرگمی شده و با نوشتن یک فرم از واژه» ناخواسته بسیاری نتایج را که حاوی 
صورت‌های دیگر یک واژه هستند از دست بدهد و فقدان توجه موتورهای کاوش به این ویژگی‌ها می‌تواند 
اف 
ب- وی ژکی‌های معنایی: در مورد اين ویژگی‌ها حسینی بهشتی (۱۳۸۶) معتقد است. دو مشکل عمده 
در ارتباطات معنایی واژگان و جود دارد که عبارت‌اند از: 
۷ چندمعنایی» یعنی زمانی که یک کلمه واحد دارای معانی متعدد است. 
۷ ترادف. به این معنی که کلمات متفاوت دارای یک معنی هستند. 
هر دو پدیده مذ کور» روابط شناسایی متداول در نظام بازیابی اطلاعات را مختل می‌سازند. به‌طور 
کلی از جمله ویژگی‌های معنایی زبان فارسی می‌توان همنامی یا واژه‌های یکسان با معانی متفاوت (واژگان 
مشت رک لفظی)» چند معنایی» هم معنایی و ترادف را نام برد که همه اين موارد در حوزه معنایی زبان می‌توانند 
همان چند گونگی‌های ذکر شده را ایجاد کنند. بدین معنی که کاربر در کاوش واژه با معنایی که در ذهن 
دارد دچار مشکل شده و گاهی موتورهای کاوش معانی دیگری غیر از آنچه که وی مدنظر دارد را بازیابی 
می کنند. مانند آنچه در جستجوی واژه «قلب» اتفاق می‌افتد. علاوه بر آنچه ذ کر شد. «نبود استاندارد و شناور 
بودن ویژگی‌های رسم‌الخط و مفاهیم در زبان فارسی موجب گردیده که تقریبً به تعداد صفحات وب فارسی 
سبک و سیاق نگارشی برای این زبان به کار رفته باشد» (2005 ,21 66 »6 8011). بنابراین یافتن راهکارهایی 


جهت کاهش این مسائل مبتنی بر نتایج پژوهش‌ها در این حوزه امری ضروری به‌نظر می‌رسد. 


3 3 
پرسش‌های پژوهش 
) مشکلات عمده مربوط به خط و زبان فارسی» براساس ویر گی‌های نگارشی (معنایی و نوشتاری) موجود در 
واژگان انتخابی در ارتباط با جستجو و بازیاپی تصاویر در موتورهای کاوش موردمطالعه چه هستند؟ 


۲ کارآمدترین موتور کاوش در بازیابی تصاویر جهت انطباق با زبان فارسی کدام است؟ 


پیشینه پژوهش 

بررسی‌های صورت کوفته در مورد پیشینه‌ها نشان می‌دهد که در اغلب موارد مسائل نوشتاری در 
ارتباط با بازیابی اطلاعات متنی از موتورهای کاوش بر گزیده مدنظر بوده‌اند و در میان پیشینه‌های فارسی نیز 
پژوهشی که جنبه‌های نوشتاری و معنایی زبان را توآمان و در ارتباط با بازیابی تصاویر در نظر بگیرد انجام 


نشده است. در ادامه به برخی از پژوهش‌های صورت گرفته اشاره می‌شود. 


سال ۵ شماره ۲ پاییز و زمستان ۱۳۹۴ بررسی مشکلات جستجو و بازیابی تصاویر... ۲۱۱ 


به‌عنوان نمونه یافته‌های مربوط به پژوهش‌ها و مطالعات (عبداللهی و جو کار ۰۱۳۸۸ (گل‌تاجی و 
بذ ر گر ۰0۱۳۸۹ (آ خشیکک و فتاحی» ۰۱۳۹۱ (ستوده و هنرجویان» )۱۳٩۱‏ ضمن تبیین و شناسایی بسیاری از 
ویژگی‌ها و مشکلات نگارشی زبان فارسی؛ در مجموع حاکی از آن است که رسم‌الخط فارسی یکی از 
متغیرهای عمده در ذخیره و بازیابی اطلاعات به زبان فارسی است و برخی ویژگی‌های املایی و ریخت‌شناسی 
زبان فارسی در فرایند کاوش مشکلاتی را پیش روی کاربران قرار می‌دهند به نحوی که عدم آ گاهی و با 
توجه کاربر به این ویژگی‌ها سب ایجاد اختلال در کاوش و در نتیجه شکست جستجوی او می‌شود. از 
مسائل دیگر عدم توجه موتورهای کاوش وب به شیوه‌های نگارش زبان فارسی به‌منظور بهبود عملکردشان 
در کاوش و به معنای اخص مواجهه با کاربران فارسی‌زبان است. حتی در مورد پایگاه‌های اطلاعاتی داخلی 
نیز بررسی‌ها نشان داد که چالش‌های ریختی شناخته شده زبان فارسی تأثیر زیادی بر بازیابی اطلاعات در 
برخی از پایگاه‌های موردنظر دارند. همچنین مرور برخی پیشینه‌های خارج از کشور شامل پژوهش‌های 
لازارینیس۱ (۲۰۰۸ ۲۰۰۷۰ ژانگ ولین" (۲۰۰۷» لنداوسکی" (۲۰۰۸) نیز نشان می‌دهد ریخت‌شناسی 
کلمات و عبارات جستجو شده به شدت بر بازیابی نتایج اثر دارد و موتورهای جستجو به‌جای تمرکز بر نیاز 
واقعی کاربران در جهت بهبود فرایند کاوش» بیشتر بر شکل کلیدواژه‌ها تکیه می کنند؛ حتی بعضی موتورهای 
جستجوی محلی نیز ریخت‌شناسی سژالات را در نظر نمی‌گیرند و بنابراین جستجوی کاربر شکست 
می‌خورد. یافته‌ها همچنین حاکی از آن است که گ وگل در میان بسیاری از موتورهای جستجو مجهز به 
ویژگی پشتیبانی چندزبانه؛ به ترتیب بهترین جستجوگر با پشتیبانی چندزبانه است. 

با در نظر گرفتن نزدیکی و شباهت‌های دو زبان فار سی و عربی خصو صا به لحاظ الفبایی برر سی 
پیشینه‌های عربی موجود در این زمینه مانند مطالعات مقداد و لارج"(۲۰۰۱) هامو*(۲۰۰۹) و تاویلا و 
دیگران*(۲۰۱۰) در کل نشان‌دهنده این است که در رابطه با جستجو به زبان عربی در موتورهای کاوش؛ 
جستجوی واژه‌های عربی بدون پیشوند تعداد نتایج بازیابی شده را به‌طور چشمگیری کاهش می‌دهد. 
همچنین م شخص شد که گسترش سوال با روش‌های مختلفی مانند اعراب گذاری برای بهبود جستجو و 
بازیابی متون عربی ثمربخش است. دیگر اينکه موتور کاوش گوگل تقریباً در بیشتر موارد عملکرد بهتری 


نسبت به سایر موتورهای جستجوی مورد مطالعه داشته است. 
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۲ پژوهش‌نامه کتابداری و اطلاع‌رسانی» دانشگاه فردوسی مشهد سال ۵ شماره ۰۲ پاییز و زمستان ۱۳۹۴ 


بررسی پیشینه‌ها در مجموع حاکی از آن است که ویژگی‌ها و مشکلات زبانی به‌عنوان عامل مهمی 
در بحث جستجو و بازیابی اطلاعات مطرح هستند و در موارد بسیاری به آنها پرداخته شده است. اما در 
مورد زبان فار سی به دلیل ماهیت و صو صیات منح‌صر به فرد آن. هنوز جای تحقیق و کار بسیار ااست. 
ا ضافه بر آن پیشینه‌های داخلی یاد شده بر روی اطلاعات متنی تمرکز دا شته‌اند و در مورد اطلاعات چند 


روش‌شناسی پژوهش 

پژوهش حاضر از نوع کاربردی است. برای پاسخ گویی به سوالات پژوهش از روش ارزیابی با 
مشاهده مستقیم استفاده شد. بدین منظور» پس از بررسی منابع مرتبط و پیشینه‌های فار سی پژوهش با توجه 
به ویژگی‌ها و مشکلات ذکر شده در آنها برای زبان فارسی نسبت به تهیه سیاهه محقق ساخته اقدام شد. در 
واقع کلیدواژه‌های موجود در سیاهه این پژوهش پیونددهنده میان ویژگی‌های نگارشی زبان فارسی و 
توانایی موتورهای کاوش در پاسخ گویی به این خصوصیات است. به این ترتیب که برای هر یکک از 
ویژگی‌های نو شتاری و معنایی زبان فار سی واژه‌ای انتخاب شد تا به‌عنوان کلیدواژه کاوش» مبنا قرار گیرد 
به‌عنوان نمونه برای ویژگی «هم نامی» از واژه «شیر؛ برای آزمون موتورهای کاوش در رابطه با این ویژگی 
استفاده شد. سپس به جهت ماهیت بین‌رشته‌ای موضوع پژوهش با استفاده از نظرات اساتید علم اطلاعات و 
دانش شناسی و زبان و ادبیات فارسی از روایی سیاهه اطمینان حاصل شد (بدین معنی که آیا واژگان 
استفاده شده در سیاهه به‌درستی نمایانگر ویژگی مربوطه هستند؟). در نهایت سیاهه‌ای محقق ساخته شامل 
مشکلات و ویژگی‌های نوشتاری یعنی خصوصیاتی از زبان فارسی که با ربخت شناسی و ظاهر خط مرتبط 
هستند (پانزده ویژگی) و معنایی یعنی ویژ گی‌های که مربوط به معناشناسی واژگان فارسی هستند (چهار 
ویژگی) که در مجموع در ب رگیرنده ۳۶ متغیر (کلمه) بود؛ تهیه شد". به‌منظور گرد آوری داده‌ها؛ در تاریخ 
معین (شهریور ۱۳۹۲ هریک از متغیرها توسط پژوهشگران به تفکیکک. وارد بخش جستجوی تصاویر 
موتورهای کاوش مورد پژوهش شد و نتایج حا صل در جداولی ثبت شدند. در جداول یاد شده در بخش 
مسائل نوشتاری صورت‌های مختلف متصور برای هر واژه درج و سپس در میان پنجاه تصویر نخست 
بازیایی شده به‌صورت جداگانه تعداد یافته‌هایی که عیناً دارای همان کلیدواژه وارد شده توسط محققان 


از میان ویژگی‌های نوشتاری و معنایی» گزینه‌هایی که قابلیت و بعد بصری داشتند و مناسب به کارگیری در پژوهش حاضر 


بودند انتخاب شدند. به‌عنوان مثال استفاده از اسامی به جای افعال. 


سال ۵ شماره ۲ پاییز و زمستان ۱۳۹۴ بررسی مشکلات جستجو و بازیابی تصاویر... ۲۱۳ 


تعداد یافته‌هایی که حاوی دیگر صورت‌های نوشتاری درج شده در جدول و در نهایت یافته‌هایی با 
برچسبی متنی که حاوی هیچ یک از حالت‌های یاد شده نبودند (برای مثال نتایج بازیابی شده با برچسب 
متنی به زبان انگلیسی) شمارش و ثبت شدند. در بخش مسائل معنایی نیز به همین ترتیب عمل شد با این 
تفاوت که در مورد کلمات فاقد صورت‌های مختلف نو شتاری. مانند واژه‌های شیر و شور)؛ در میان پنجاه 
نتیجه نخست بازیایی شده. تعداد تصاویری که حاوی معانی مختلف کلیدواژه جستجو شده بودند» شمارش 
و ثبت شدند. در این پژوهش تجزیه و تحلیل داده‌ها در دو سطح توصیفی و استنباطی انجام شد و برای این 
منظور از نرم‌افزار آماری 5۳55 و برای تفسیر از نرمافزار :۷0 و ۳:61 استفاده شده است. 


یافته‌های پژوهش 

پرسش اول: مشکلات عمده مربوط به خط و زبان فارسیء براساس ویژگی‌های نگارشی (نوشتاری 
و معنایی) موجود در واژگان انتخابی در ارتباط با جستجو و بازیابی تصاویر در موتورهای کاوش مورد مطالعه 
چه هستند؟ 

برای شناسایی مشکلات عمده نوشتاری و معنایی موجود در این واژگان پس از وارد کردن 
کلیدواژه‌های موجود در سیاهه محقق ساخته در قسمت جستجوی تصاویر نتایج بازیابی شده بررسی» 
شمارش, و ثبت شدند. پس از تجزیه و تحلیل آماری با استفاده از آزمون کای اسکور نتایج ذیل برای 
واژه‌ها (هر یک از واژه‌ها نمایانگر یکی از مشکلات نو شتاری و معنایی زبان فار سی هستند) به‌د ست آمده 
است. 

جدول ۱. نتایج آزمون کای اسکور مربوط به حالات مختلف نگارشی کلیدواژه‌های مورد پژوهش 
در بخش نوشتاری 


۱ درجه سطح ریب نتیجه 
مسئله نوشتاری واژه‌ها مقدار | - 
آزادی | معناداری فی معنادار 
انفولانزا- آنفلوآنزا-آنفولانزا ۳/۶۷ ۴ ۴۵۲ ۰,۱۲ نیست 
ضبط واژگان لاتين 

تیتانیوم- تیتانیم ۰۹۴۶ ۲ ۳« ۰/۶۸ نیست 
واژگان دخیل و معادل کامپیوتر - رایانه ۱/۳ ۲ ۰/۵۶۷ 5۹« نیست 
آنها سیستم - نظام - سامانه ۱,۷۴ ۴ ۰/۸۹ ۹۵۴+ تست 
واژگان مشتق پستچی - پست چی ۱/۷۷ ۲ ۰/۱ ۰/۳۱ است 
واژگان مرکب کتابخانه - کتاب خانه ۱/۹ ۲ ۰/۵۱ ۷۲ تست 
دانشسرا- دانش‌سرا ۳۹/۲۵ ۲ ۰.۰ ۰/2۴۷ است 

واژگان مشتق- م رکب ِ 
فناوری- فن آوری ۳/۹۶ ۲ ۰/۱۳۸ ۳ نیست 


۴ پژوهش‌نامه کتابداری و اطلاع‌رسانی دانشگاه فردوسی مشهد سال ۵ شماره ۰۲ پاییز و زمستان ۱۳۹۴ 


علائم جمع گل‌ها - گل‌ها ۴۱ ۲ ۰/۶۷ ۴ نیست 
انواع جمع‌های فارسی و مدارس - مدرسه‌ها ۷/۴ ۲ ۳/۸ ۳۶ است 
مکسر کتاب‌ها- کتب ۱۳/۱ ۲ 1۲ ۰/۴۱ سا 
طریقه نگارش الف کسری- کسرا ۰,2۹ ۲ ۹۶ ۰/۸ نیست 
مقصوره مصلی - مصلا 2 ۲ ۰۹۹۹ ۰۲ نیست 
استفاده با عدم کاربرد سکن مسگنت مسکن ۰۳۸ ۲ ۹۹ ۰/۸ فیبینت 
اعراب گذاری کرت کرت کر ۲/۷۲ ۴ ۰/۶۰۵ ۰/۸۶ 2 
استفاده از تای منقوط زکاءٌ- ز کات ۴/۱ ۲ ۰/۱۳۸ ۰/۱۳۸ نیست 
امضاء - امضا ۳/۳ ۲ ۰/۳۹ ۰۲ تست 
شی۰- شی ۹/۱ ۲ ۰*۰۱ ۳۶ است 
نحوه نگارش همزه میا 
ن 1 ۳۴ ۲ ۰/۷ ۶ ی 
موذن- موذن ۱۵۷ ۲ ۰/۹۷ ۱۵۷ نیست 
مأمور- مأمور و ۲ ۴ ۹ نیست 
استفاده و عدم استفاده از محمد -محمد ۳۲ ۲ ۰۸۹۴۱ ۳۲ تست 
تشد ید زمرد - زمرد ۱/۶۵ ۲ ۰,۳۳۱ ۹ یس 
کسره اضافه و بدل‌های اعضا بدن- اعضای بدن- 
۱ 9۴ ۴ ۰/۹۵۸ ۰۴۷ تست 
آن اعضاء بدن 
آذوقه- آزوقه ۱/۹۸ ۲ ۰۳۳۷ ۱۱۳۳ نیست 
واژه‌های دو املائی 
تهران- طهران ۰/۹۱۸ ۲ 9۳ ۰/۶ تست 
جابجایی ی و همزه در پاییز - پائیز ۱۳/۵۷۱ ۲ ۷ ۷ نیست 
کلمات فارسی آیینه - آثینه ۱/۳۳ ۲ ۰/۵۱ ۲ نیست 
نحوه نگارش ه غیرملفوظ جامعه‌اطلاعاتی» جامعه‌ی 
3 ۱/۳۲ ۴ ۸ ۳ | نیست 
وی میانجی اطلاعاتی» جامعهٌ اطلاعاتی 
استفاده از زبان محاوره خانه - خونه ۸/۳۲ ۲ ۰۱۶ ۳۷ است 
کاربرد و حذف مد در ی 
پیشاهنگک - پیشآهنگ ۰/۴۵۸ ۲ ۰/۷۹۵ ۰/۴۵ شک 


کاتانت فرب 

در جدول شماره ۱ مقدار کای اسکور درجه آزادی» سطح معنادار و ضریب فی برای تک‌تکك 
واژه‌ها در بخش نوشتاری محاسبه شده است. همان‌طور که در جدول یاد شده مشهود است. در رابطه با 
واژه‌هایی که سطح معنادار بز رگک‌تر از آلفا ۰/۰۵ دارند با اطمینان ۹۵/؛ رابطه معنی‌داری بین ویژگی‌های 


نوشتاری و مشکلات مربوط به بازیابی تصاویر از موتورهای کاوش مورد مطالعه وجود ندارد؛ اما سطح 


سال ۵ شماره ۲ پاییز و زمستان ۱۳۹۴ بررسی مشکلات جستجو و بازیابی تصاویر... ۲۱۵ 


معنادار به‌دست آمده برای واژه‌های پستچی- پست‌چی «واژ گان مشتق). دانشسرا- دانش‌سرا (واژگان مشتق- 
م رکب) مدارس- مدرسه‌ها و کتاب‌ها- کتب (انواع جمع‌های فارسی و مکسر عربی شیع- شی (نگارش 
همزه پایانی بدون کرسی) و خانه - خونه (استفاده از زبان محاوره) از آلفا مفروض ۰/۰۵ کوچک‌تر است؛ 
پس با اطمینان ۰/۹۵ رابطه معنی‌داری بین این ویژگی‌هاء و مشکلات مربوط به جستجو بازیابی تصاویر از 
موتورهای کاوش مورد مطالعه وجود دارد و در مجموع. مسائل مربوط به پیوسته‌نویسی و جدانویسی کلمات 
مشتقی» مشتق- م رکب انواع جمع‌های فارسی و مکسر عربی؛ نگارش همزه بدون کرسی و استفاده از زبان 
محاوره؛ جزء مشکلات عمده مربوط به جستجو و بازیابی تصاویر از موتورهای کاوش مورد پژوهش هستند. 


جدول ۲. نتایج آزمون کای اسکور مربوط به معانی گونا گون کلیدواژه‌های مورد پژوهش در بخش معنایی 
۱ درجه | سطح | ضریب | نتیجه 


مسئله معنا اژه‌ها مقدار | - ۱ 

ی آزادی | معناداری فی معنادار 
واژه‌های یکسان شیر (حیوان)- شیر (لبنی)- شیر (شیر آب) | ۱/۶۳ ۲ ۴ ۴ | نیست 
با معانی متفاوت 
واژگان هم نویسه 

شور (طعم)- شور (اشتیاق) ۱/۴ ۲ ۰/2۹ ۴ ۱ نیست 
با معانی متفاوت 


قلب (عضو بدن)- قلب (خاطر و ضمیر)- 


۶2۳۷ ۲ ۸۱۴۰۱/"* ۰/۱۳۹ است 
قلب (وارونه کردن)- قلب (م رکز) 
چند معنایی 
نوک (اشیاء)- نوک 
۰/2۹ ۲ ۰/۸۷۴۵ ۹ ۱ نیست 
(پرنده ) 
معنایی و 
وت دریای خزر- دریای کاسپین- دریای 
ترادف ۲/۶۸ ۴ ۰/۷۰۵ ۷ تست 


مازتران 


همان‌طور که در جدول ۲ مشهود است. در رابطه با واژه‌هایی که سطح معنادار بزرگ‌تر از آلفا ۰/۵ 
دارند با اطمینان ۹۵/؛ رابطه معنی‌داری میان ویژگی‌های معنایی و مشکلات مربوط به بازیابی تصاویر از 
موتورهای کاوش مورد مطالعه وجود ندارد؛ اما سطح معنادار به‌دست آمده برای معانی مختلف واژه قلب 
(چند معنایی) از آلفا مفروض ۰/۰۵ کوچک‌تر اس پس با اطمینان ۰/۹۵ رابطه معنی‌داری بین این ویژگی 
معنایی و مشکلات مربوط به جستجو بازیابی تصاویر از موتورهای کاوش مورد مطالعه وجود دارد و در 
مجموع مبحث معنایی» مسئله مربوط به چند معنایی, از مشکلات عمده مربوط به جستجو و بازیابی تصاویر 


از موتورهای کاوش مورد پژوهش است. 


۳۶ پژوهش نامه کتابداری و اطلاع‌رسانی» دانشگاه فردوسی مشهد 


سال ۵ شماره ۰۲ پاییز و زمستان ۱۳۹۴ 


برای شناسایی کارآمدترین موتور کاوش جهت انطباق و توجه به ویژ گی‌های نوشتاری و معنایی 


زبان فارسیء از میان سه موتور جستجوی مورد پژوهش؛ پس از وارد کردن کلیدواژه‌های موجود در سیاهه 


محقق ساخته در قسمت جستجوی تصاوین نتایج بازیابی شده بررسی و ثبت شدند. پس از تجزیه و تحلیل 


آماری با استفاده از آزمون فریدمن نتایج ذیل به‌دست آمده است. 


جدول ۳. نتایج آزمون فربدمن مربوط به میانگین موتورهای کاوش. در بازبایی حالات مختلف نگارشی 


مسئله نوشتاری 


ضبط واژگان لاتين 


واژگان دخیل و معادل آنها 


2 ۰ 
واژ ان مشتق 


واژگان م رکب 


واژگان مشتق- م رکب 


وی توت 
انواع جمع‌های فارسی و 


مک 
طریقه نگارش الف مقصوره 


استفاده با عدم کاربرد 
اعراب گذاری 


استفاده از تای منقوط 


نحوه نگارش همزه میانی و 
پایانی کلمات 


واژه‌ها 


آنفولانزا- انفولانزا - 
آنفلو آنزا 
تیتانیوم- تیتانیم 
کامپیوتر- رایانه 
سیستم- نظام - سامانه 
پستچی 7 پست چی 
کتابخانه- کتاب خانه 
دانشسرا- دانش سرا 
فناوری- فن آوری 
گل‌ها - گل‌ها 
مدارس - مدرسه‌ها 
کتاب‌ها- کتب 
کسری- کسرا 
مصلی - مصلا 


مک کت مک 


کرهت کرو کره 
کاءٌ- ز کات 
امضاء - امضا 
شیء- شی 


موذن- موذن 


کلیدواژه‌های مورد پژوهش در بخش نوشتاری 


گ وگل 


۳۱/۳۴۳۷ 


۳۳/۳۵ 
۱۳/۳۲۳ 
۳۱/۳۳ 
۳۳/۸۲ 
۳۱/۳۳/۸ 
۱۳/۳۸ 
۳۳/۹ 
۳۳/۳۲ 
۳۹/۵۸ 
۱۳/۳۶ 
۳۰/۸/۸ 
۳۳/۶۹ 
۳۸/۶۴ 
۳۸/۶۴ 
۳۹/۳/۸۴ 
۳۵/۶۹ 
۳۵/۳۳ 
۴۳۱/۳۲ 


۳۹/۰۳ 


قوی تربن 
موتور کاوش 


سال ۵ شماره ۰۲ پاییز و زمستان ۱۳۹۴ 


استفاده و عدم استفاده از 


تشد ید 


کسره اضافه و بدل‌های آن 


واژه‌های دو املائی 
جابجایی ی و همزه در 
کلمات فارسی 

نحوه نگارش ه غیرملفوظ و 
ی میانجی 


استفاده از ژبان محاوره 


مأمور- مأمور 
محمد مان 
زمرد - زمرد 
آخضا یدق - اغضای نادند 
اقا بتق 


جامعه‌اطلاعاتی» جامعه‌ی 


اطلاعاتی» جامعهٌ اطلاعاتی 


خانه - خونه 


کاربرد و حذف مد در پیشاهنگ - پیش هنگ 


کلمات فارسی 


بررسی مشکلات جستجو و بازیابی تصاویر... ۲۱۷ 


۴۳۱/۸۱ 
۱۳۰/۸۳۲ 


۱۶/۳ 


۳۹/۹۵ 


۳۳/۶ 


۳۱/۸۳/۸ 


۳۳/۶ 


۱۸/۴۵ 


۳۹/۳ 


۳۹/۸۹ 


۴ 


۴/۷ 
۴۴۳/۹۷ 


۳۳/۳ 


۳۷/۹۲ 


۳۰/۶۲ 


۳۶/۳ 


۱۳۵2/۹۱ 


۳۶/۸ 


۱/۹ 


۳۸/۸/۱ 


۴۰ 


۴۴/۸۵ 
۴۳۰/۹۷ 


۳۹/۳۰۳ 


۳۷/۸/۳۲ 


۱۳5/۸۷۴ 
۳۰/۶۷ 
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۳۱/۹۲ 


۳۵/۳۳ 


۴۳۴۳/۸ 


۳/۸ 


با استفاده از آزمون فریدمنء میانگین واژه‌ها به تفکیک موتورهای کاوش مورد پژوهش محاسبه 


شد. نتایج جدول شماره ۳ نشان می‌دهد که در بخش نوشتاری به ترتیب» موتورهای کاوش گوگل یاهو و 
در آخر بینگ بیشترین تطبیق را با ویژگی‌های نوشتاری زبان فارسی دارند. 
جدول ۴. نتایج آزمون فریدمن مربوط به میانگین موتورهای کاوش. در بازیایی معانی گوناگون 
کلیدواژه‌های مورد پژوهش در بخش معنایی 


مسئله معنایی واژه‌ها 


واژگان هم نویسه با 
92 شور (طعم)- شور اشتیاق) 
ی تماوت 


نوک (اشیاء)- ن وکک (پرنده) 
چند معنایی 


قلب (عضو بدن)-قلب (خاطر و ضمیر) 


۱ دریای خزر- دریای کاسپین- دریای 
هم‌معنایی و ترادف 
مازتدرآن 


هم‌نامی شیر (حیوان)- شیر (لبنی) 


گ وگل 


1۹ 


۹/۷ 
۳۸۳/۱۲ 


۱۳۲۳/۱ 


۱۳۶/۸۲ 


قوی تربن 
موتور کاوش 


۸ پژوهش‌نامه کتابداری و اطلاع‌رسانی؛ دانشگاه فردوسی مشهد سال ۵ شماره ۲ پاییز و زمستان ۱۳۹۴ 


همان‌طور که در جدول شماره ۴ مشاهده می‌شود. محاسبه میانگین واژه‌ها با استفاده از آزمون فریدمن 
نشان می‌دهد که در بخش معنایی نیزه موتورهای کاوش گوگل بینگ و در آخر یاهو به ترتیب بیشترین 
انطباق را با ویژگی‌های معنایی زبان فارسی دارند. در مجموع نتایج جداول ۳و ۴ نشان می‌دهد که در دو 
بخش ویژگی‌های نوشتاری و معنایی» از بین سه موتور کاوش مورد پژوهش؛ موتور جستجوی گوگل؛ 
بیشترین انطباق را با اي ویژگی‌ها دارده و پس از آن موتور کاوش بینگ و یاهو در جایگاهی برابر قرار 
می‌گیرند. 

با توجه به یافته‌های پژوهش حاضر بین ویژگی‌ها و مسائل مربوط به پیوسته‌نویسی و جدانویسی 
واژگان مشتق, مشتق- م رکب انواع جمع‌های فارسی و مکسر عربی» نگارش همزه بدون کرسی و استفاده 
از زبان محاوره در بخش نوشتاری و همچنین مشکل مربوط به چند معنایی در بخش معنایی و مشکلات 
مربوط به بازیابی تصاویر از موتورهای کاوش مورد مطالعه رابطه معنی‌داری وجود دارد. به‌عنوان نمونه با 
انتخاب کلیدواژه پستچی توسط کاربر و بازیابی تصاویر مربوط به اين واژه» کاربر بدون اينکه آگاه باشد؛ 
در بسیاری موارد از دستیابی به تصاویر با برچسب پست چی محروم مانده و تعداد قابل توجهی از نتایج را از 
دست می‌دهد. همچنین با دقت در یافته‌ها می‌توان دریافت که واژگان عربی موجود در زبان فارسی مانند 
آنچه در بحث انواع جمع‌ها و نگارش همزه آمد. سهم قابل توجهی از این مشکلات را به خود اختصاص 
داده‌اند. در بخش ویژگی‌های معنایی نیز مسئله چندمعنایی مشکل عمده‌ای محسوب می‌شود نظیر آنچه 
کاربر در کاوش واژه قلب با آن روبرو می‌شود بدین معنا که در بسیاری موارد کاربر تنها تصاویری را که 
حاوی یکی از معانی این واژه هستند در میان نتایج ابتدایی بازیابی می‌کند و در نتیجه دچار سردرگمی 
می‌شواد. 

در نتیجه مسائل یاد شده. از مشکلات عمده زبان فارسی در جستجو و بازیابی تصاویر از موتورهای 
کاوش مورد پژوهش به‌شمار می‌آیند» که با توجه به ویژگی‌های این موتورهای کاوش» قابل تعمیم به انواع 
دیگر موتورهای جستجو گر و نیز جستجوی سایر گونه‌های اطلاعات نیز هستند. یافته‌های مذ کور با نتایج 
حاصل از پژوهش عبداللهی و جو کار (۱۳۸۸) مبنی بر اینکه هیچ کدام از موتورهای کاوش چالش‌های 
شیوه‌های نگارش فارسی را به‌منظور بهبود نتیجه کاوش؛ مورد توجه قرار نداده‌اند؛ هم‌سویی دارد. همچنین 
بررسی یافته‌ها؛ هم‌سویی آنها با نتایج حاصل از پژوهش لازارینیس (۲۰۰۷) مبنی بر اينکه موتورهای کاوش 


نتایج مختلفی را برای واژه‌های متفاوت از نظر رد - یخت شناسی و نوشتاری بازیابی می کنند؛ نشان می‌دهد. نتایج 


سال ۵ شماره ۲ پاییز و زمستان ۱۳۹۴ بررسی مشکلات جستجو و بازیابی تصاویر... ۲۱۹ 


پژوهش رائی ساربانقلی (۱۳۸۵) هم حاکی از آن است که ویژگی‌های املایی و ریخت‌شناسی زبان فارسی 
در کاوش اطلاعات از موتورهای کاوشء مشکلاتی ایجاد می کند که با یافته‌های پژوهش حاضر هم‌سویی 
دارد. 
همچنین نتایج دو بخش نوشتاری و معنایی مبنی بر برتری قابلیت‌های موتور کاوش گ وگل نسبت به 
یاهو و بینگ با نتایج حاصل از پژوهش ژانگ و لین (۲۰۰۷) که گوگل را بهترین موتور با ویژگی پشتیبانی 
چندزبانه در بین موتورهای کاوش مورد بررسی‌شان می‌دانند» هم‌سویی دارد؛ اما در مجموع. موتورهای 
کاوش مورد پژوهش نسبت به ویژگی‌های نوشتاری و معنایی زبان فارسی توجه کافی ندارند. و بسیاری از 
ویژگی‌های آن را در هنگام جستجو و بازیابی تصاویر نادیده می گيرند. این مسئله موجب می‌شود که احتیاج 
فارسی‌زبانان به موتورهای کاوش بومی که مبتنی بر ویژگی‌های زبانی خودشان طراحی شده باشد بیش از 
پیش احساس شود. از سوی دیگر موتورهای جستجوی گ وگل بینگ و یاهو که جزء موتورهای کاوش 
محبوب هستند نیز باید نسبت به برآورده ساختن نیازهای کاربران غیرانگلیسی زبانشان بیشتر تلاش کنند. 
همان‌طور که نتایج این پژوهش نشان داد نادیده انگاشتن و یا کم توجهی به شاخصه‌ها و ویژگی‌های زبانی 
کاربران موجب بروز مسائلی در امر جستجو و بازیابی اطلاعات می‌شود که در نهایت از دست رفتن اطلاعات 
مفید و یا بازیابی اطلاعات ناخواسته را به همراه خواهد داشت. در ادامه با توجه به یافته‌های پژوهش 
پیشنهادهایی به شرح زير ارائه می‌شود: 
با توجه به یافته‌های پژوهش بسیاری از مشکلات نگارشی فرایند کاوش و بازیابی تصاویر از 
موتورهای کاوش مربوط به گوناگونی نوشتار یک مفهوم واحد هستنده لذا تلاش برای یکپارچگی 
شیوه‌های نگار شی در محیط وب به‌عنوان نمونه تدوین شیوه‌نامه‌ای استاندارد برای نو شتن در وب 
می‌تواند تا حدی از این مسائل بکاهند. 
به‌منظور آگاهی کاربران فارسی‌زبان از گوناگونی‌های نوشتاری یاد شده تدوین شیوه‌نامه‌ای 
آموزشی برای کاربران با تأ کید بر مشکلات عمده شناسایی شده در این پژوهش» می‌تواند کاربران 
را در بازیابی موفق‌تر یاری کند. 
ایجاد ساز و کاری در موتورهای کاوش جهت آگاهی دادن به کاربران همزمان با درج کلیدواژه در 
هنگام جستجو از طریق نمایش مترادفات معادل فارسی واژگان دخیل و همچنین صورت‌های 
املایی گوناگون می‌تواند از سردر گمی کاربر پیشگیری کند. 


۰ پژوهش‌نامه کتابداری و اطلاع‌رسانی» دانشگاه فردوسی مشهد سال ۵ شماره ۲ پاییز و زمستان ۱۳۹۴ 


۷ در انتها پیشنهاد می شود متولیان امر» نظیر فرهنگستان زبان و ادب فار سی نظارت بیشتری نسبت به 
رعایت یکپارچگی و هماهنگی در متون تولید شده به‌صورت چاپی و الکترونیک داشته باشند تا 
ضمن حراست از زبان غنی فارسی. از بروز برخی چالش‌هایی از قبیل آنچه در این پژوهش 
شناسایی و بررسی شد جل و گیری نمایند. 

نظر به نتایج پژوهش پیش رو در بسیاری موارد عدم توجه به ویژگی‌ها و ظرایف نوشتاری و معنایی زبان 
فار سی موجب پروز | شکالات جدی در فرایند جستجو و بازیابی تصاویر می شود؛ از همین رو در 
ادامه پیشنهادهای پژوهشی که انجام آن در آینده می‌تواند زمینه‌ساز حل این چالش‌ها باشد ارائه 
ینود 

انجام پژوهش‌هایی بین‌رشته‌ای با رویکرد سبب‌شناسی و چرایی مسائل به‌وجود آمده در اثر 
رویارویی ویژگی‌های خط و زبان فارسی با فناوری‌های نو. 

۷ انجام پژوهش‌هایی با هدف سنجش میزان آشنایی و توجه کاربران فارسی‌زبان موتورهای کاوش به 
ویژگی‌های خط و زبان فارسی و ارزیابی تأثیر آن بر موفقیت جستجو. 

۷ بررسی مقایسه‌ای بین موتورهای کاوش بومی با انواع غیربومی آن با معیار توجه به ویژگی‌های خط 
و زبان فارسی. 

برر سی فرایند نمایه سازی تصاویر در موتورهای کاوش پر کاربرد و شنا سایی نقاط ضعف و قوت 
آنها با توجه به شاخصه‌های نوشتاری و معنایی زبان فارسی. 

۷ بررسی امکان ایجاد راهبردهای فرا کاوش جهت بهبود جستجو و بازیابی تصاویر به زبان فارسی. 
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